Para esta ocasión de trabajo se utilizará el Software de R. El cual es: Un lenguaje de programación de código abierto y que es enfocado en el análisis de datos, especialmente en el tema estadístico. Sus creadores son Robert Gentleman y Ross Ihaka. En el link de https://www.r-project.org/index.html podrá encontrar todo lo relacionado con el programa que usaremos.
Los complementos y bases de este curso regularmente son demos de otras bases reales o utilizadas en los distintos textos de econometría que han venido realizando investigación empírica.
Muchos de los comandos y códigos aquí utilizados fueron tomados del sitio web de Florian Heiss: http://www.urfie.net/ que hace referencia al uso de R en la Econometría.
Lo primero es ir a la pagina de https://www.r-project.org e ir a la pestaña de CRAN y descargar la versión de acuerdo al sistema operativo que usted tenga, llamese Linux, Windows o IOS.
Despues de haber instalado el programa, urge ir al link de R Studio que es un potente aliado1 en el entorno de ejecución del programa R, se le denomina IDE Por sus siglas en ingles significa Integrated Drive Electronics, no es mas que un entorno de desarrollo interactivo que facilita interactuar mejor y de manera mas “amigable” con todos los asuntos de los lenguajes de programación.
Debe ir por lo pronto a la sección free, esperar el tiempo de acuerdo a la velocidad de conexión y luego ejecutarlo. Ya después de eso podrá interactuar mejor con R y visualmente todo será mejor para el trabajo.
Siempre es bueno crear unas notas de código. Es una especie de cuaderno que le permite tener apuntes o escritos para saber que va haciendo linea a linea, incluso le sirve como un historial de desarrollo, de todas maneras R tiene su propio, pero es altamente recomendable que usted lo maneje de esta forma. Lo puede hacer en formato texto o txt del block de notas en su sistema operativo o también directamente desde el programa de R studio solo presionando las teclas ctrl+shift+N o de esta manera en el menú principal:
Note que R Studio trabaja con 3 ventanas principales, estas son la de consola, Environment y File, todas tienen sus respectivas pestañas que le serán funcionales a la hora de hacer sus proyectos.
Para esta parte del curso, se establecerán algunos cálculos y operaciones básicas ya mostradas en los vídeos tutoriales de la clase y que se encuentran alojados en la carpeta de contenido en el blackboard. Esta primera parte solo tiene cálculos básicos y operaciones de tipo calculadora tal cual el programa así lo permite. Ejemplo:
3+5 # Una suma o adición
1255*sqrt(25) # Producto con la raíz cuadrada de 25
13**2 # Potencia de un número
300/25 # Simple divisiónNote que el (#) es para decirle al programa que no ejecute lo que se encuentra después de él, se usa para tomar notas o escribir algo al respecto, por ejemplo:
Para la parte de asignación de valores a una variable (X) -puede darle el nombre que le desee colocar- se tiene que:
a<-2
a=2 # También se puede usar el igual
a^2 # El cuadrado de esa variable
abs(a) # Valor absoluto de la variable
sqrt(a) # Raíz cuadrada de la variable
log(a) # Logaritmo natural
log(a,b) # Logaritmo con base al valor b correspondiente,
exp(a) # Valor Exponencial de a
factorial(a) # Factor de aEn economía y en muchas ciencias sociales se hace uso extensivo de las matemáticas y de la estadística. Muchas veces será incluso necesario calcular o realizar algunas transformaciones en las variables para poder tener unas métricas mas informativas como son los logaritmos, valores absolutos, valores de forma exponencial o de notación científica, entre otros. Algunos comandos que se pueden usar en R para eso son:
| Operación | Resultado |
|---|---|
| Valor absoluto | abs() |
| Logaritmo | log() |
| Logaritmo base | log(,) |
| Exponencial | exp() |
| Factorial | factorial() |
| Raíz cuadrada | sqrt() |
El valor absoluto de un número como por ejemplo puede ser simplemente:
## [1] 3
Sin embargo, en una operación conjunta, si se posee una lista de elementos o un vector de elementos, es mucho mas simple implementarlo de tal forma que:
## [1] 5 19 3 11 16 18 21 31 33
De igual forma, funciona con un logaritmo o también una operación que involucre una de forma de notación científica o exponencial, esto puede notarse así:
y<-c(15,21,23,29,16,28,32,45,33) # Lista de valores para vector Y
log(y) #Se calcula el logaritmo de cada uno de los elementos## [1] 2.708050 3.044522 3.135494 3.367296 2.772589 3.332205 3.465736 3.806662
## [9] 3.496508
Observe que el Programa calcula el logaritmo natural de cada uno de los elementos del vector (y). Para la forma exponencial, es de uso de la notación del logaritmo base e y que muchos conocen como la expresión de Euler, e.g: \(e^{x}\), recuerde ademas que si este lo usamos de tal manera que \(Y=ln(e^{x})=x\). Un ejemplo de aplicación es
## [1] 1.39371e+65
Teniendo la asignación de valores a un objeto en R, podemos simplificar el uso o calculo de forma considerable.
De acuerdo a lo anteriormente expuesto, responda y halle lo valores de las siguientes formulas:
Muchas veces los vectores se convierten o consideran como una lista de elementos que finalmente constituyen una columna de una base de datos o dataframe. Para mirar un juego de esto, mire el código a continuación:
# Definimos un vector x para todos los años:
anos<- c(2018,2019,2020,2021,2022,2023)
# Definimos una matriz de y valores:
producto1<-c(10,13,16,19,17,18); producto2<-c(21,32,43,15,19,36); producto3<-c(22,43,42,21,32,21)
# Una forma de unir vectores es con el comando cbind
ventas_mat <- cbind(producto1,producto2,producto3)
# Nombramos las filas con el vector de años:
rownames(ventas_mat) <- anos
# La matriz de datos es:
ventas_mat## producto1 producto2 producto3
## 2018 10 21 22
## 2019 13 32 43
## 2020 16 43 42
## 2021 19 15 21
## 2022 17 19 32
## 2023 18 36 21
## producto1 producto2 producto3
## 2018 10 21 22
## 2019 13 32 43
## 2020 16 43 42
## 2021 19 15 21
## 2022 17 19 32
## 2023 18 36 21
Tome a consideración la siguiente tabla de datos:
Obs | X1 | X2 | X3 | X4 |
1 | 232 | 9,871 | 121 | 52 |
2 | 345 | 5,432 | 131 | 90 |
3 | 265 | 3,251 | 136 | 86 |
4 | 223 | 15,478 | 138 | 84 |
5 | 148 | 12,370 | 149 | 72 |
6 | 211 | 13,150 | 158 | 91 |
Variables númericas | ||||
Dado lo anterior
Para esta parte es importante mirar todos los elementos de trabajo con las bases y estructuras de datos. En este realizaremos algunas de las operaciones con ellas. Una forma de seleccionar variables es con la indicación del signo $ (pesos), se hace para seleccionar una variable de la tabla de datos.
## [1] 21 32 43 15 19 36
# Generar una nueva variable en el data frame
ventas$totalv1 <- ventas$producto1 + ventas$producto2 + ventas$producto3
# Lo mismo de lo anterior pero usando "with":
ventas$totalv2 <- with(ventas, producto1+producto2+producto3)
# Lo mismo pero usando el comando "attach":
attach(ventas)## The following objects are masked _by_ .GlobalEnv:
##
## producto1, producto2, producto3
## producto1 producto2 producto3 totalv1 totalv2 totalv3
## 2018 10 21 22 53 53 53
## 2019 13 32 43 88 88 88
## 2020 16 43 42 101 101 101
## 2021 19 15 21 55 55 55
## 2022 17 19 32 68 68 68
## 2023 18 36 21 75 75 75
Para colocar esto en practica, responda las siguientes consideraciones:
Para mayor información consulte la pagina web o enlace de R Studio.↩︎